研究:用诗歌就能让AI说违禁内容,成功率达62%
[焦点] 时间:2025-12-13 15:29:00 来源:保定市某某通信设备服务中心 作者:知识 点击:150次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容乌海市某某商业展览服务中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功乌海市某某商业展览服务中心实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:焦点)
相关内容
- 现实真正的大女主,比《玫瑰的故事》更爽
- 南京公积金发布新政:南京都市圈9城公积金互认互贷
- 漫评|中欧班列:满载机遇,搭建“双向奔赴”幸福桥
- 6家拟IPO券商业绩出炉:4家双增,2家双降
- 委内瑞拉副总统指责美国扣押油轮企图“掠夺委石油”
- 酒后吃药昏迷38天,31岁网红俄罗斯娜娜去世
- “叫花鸡没有鸡”涉事商户道歉,赔偿消费者1000元
- 男子碰倒自行车被索赔3万8?店方致歉
- 委内瑞拉副总统指责美国扣押油轮企图“掠夺委石油”
- 奥运资格赛精彩呈现,城市体育节打造潮流体育“四大展玩圈”
- 委内瑞拉军方击落2架非法进入该国领空的飞机
- 4月公募FOF最高收益率超4% 养老目标基金表现优异
- 甲流可能“二次感染”?专家:短期可能性低
- 第三轮第二批中央生态环保督察启动
精彩推荐
- 现实真正的大女主,比《玫瑰的故事》更爽
- 一个月内第二起?网友自称洗澡时被舒肤佳香皂内刀片划伤,品牌方回应
- 低空经济“蓄势腾飞” 打造未来产业增长新引擎
- 上百名清华校友校外聚餐食物中毒?海淀疾控通报
- 美国西北部暴雨持续 华盛顿州已进入紧急状态
- 巴黎奥运会期间人工智能系统将保护运动员远离网络暴力侵害
热门点击
- 特朗普公然宣称:“我憎恨泰勒·斯威夫特!” views+
- 牛弹琴:美国和菲律宾,正在酝酿新阴谋 views+
- 网传“一游客在河南某景区意外身亡”?官方通报 views+
- 英媒:俄境内200多个军事目标在乌射程范围内 views+
- 美国众议院通过法案 加强总统候选人安保 views+
- 茅台“信仰”又现动摇 明星基金经理有减有增 views+
- 美国专家澄清:美国媒体错误引用了我的话 views+
- 荷兰鹿特丹持刀袭击嫌疑人涉嫌恐怖主义 views+
- 苹果iOS 18正式发布,苹果智能首批功能下月上线 views+
- 乌:将“通过相关国家”向俄提交和平计划 views+
